智能论文笔记

Center-Embedding and Constituency in the Brain and a New Characterization of Context-Free Languages

Daniel Mitropolsky , Adiba Ejaz , Mirah Shi , Mihalis Yannakakis , Christos H. Papadimitriou

分类：自然语言处理

2022-06-27

最近显示出一种仅通过神经元的尖峰实现的计算系统，即语法，即进行简单的英语句子的依赖性解析。我们解决了这项工作所留下的两个最重要的问题：选区（句子的关键部分，例如动词短语）和处理依赖句子的处理，尤其是中央句子。我们表明，语言的这两个方面也可以由神经元和突触以与已知或被广泛相信的语言器官的结构和功能兼容的方式来实现。令人惊讶的是，我们实施中心嵌入的方式指出了无上下文语言的新表征。

translated by 谷歌翻译

NADBenchmarks -- a compilation of Benchmark Datasets for Machine Learning Tasks related to Natural Disasters

Adiba Mahbub Proma , Md Saiful Islam , Stela Ciko , Raiyan Abdul Baten , Ehsan Hoque

分类：机器学习 | 计算机视觉

2022-12-21

Climate change has increased the intensity, frequency, and duration of extreme weather events and natural disasters across the world. While the increased data on natural disasters improves the scope of machine learning (ML) in this field, progress is relatively slow. One bottleneck is the lack of benchmark datasets that would allow ML researchers to quantify their progress against a standard metric. The objective of this short paper is to explore the state of benchmark datasets for ML tasks related to natural disasters, categorizing them according to the disaster management cycle. We compile a list of existing benchmark datasets introduced in the past five years. We propose a web platform - NADBenchmarks - where researchers can search for benchmark datasets for natural disasters, and we develop a preliminary version of such a platform using our compiled list. This paper is intended to aid researchers in finding benchmark datasets to train their ML models on, and provide general directions for topics where they can contribute new benchmark datasets.

translated by 谷歌翻译

An Overview of Violence Detection Techniques: Current Challenges and Future Directions

Nadia Mumtaz , Naveed Ejaz , Shabana Habib , Syed Muhammad Mohsin , Prayag Tiwari , Shahab S. Band , Neeraj Kumar

分类：计算机视觉 | 人工智能

2022-09-21

当今智能城市中产生的大型视频数据从其有目的的用法角度引起了人们的关注，其中监视摄像机等是最突出的资源，是为大量数据做出贡献的最突出的资源，使其自动化分析成为计算方面的艰巨任务。和精确。暴力检测（VD）在行动和活动识别域中广泛崩溃，用于分析大型视频数据，以了解由于人类而引起的异常动作。传统上，VD文献基于手动设计的功能，尽管开发了基于深度学习的独立模型的进步用于实时VD分析。本文重点介绍了深度序列学习方法以及检测到的暴力的本地化策略。该概述还介入了基于机器学习的初始图像处理和基于机器学习的文献及其可能具有的优势，例如针对当前复杂模型的效率。此外，讨论了数据集，以提供当前模型的分析，并用对先前方法的深入分析得出的VD域中的未来方向解释了他们的利弊。

translated by 谷歌翻译

Transformer-Based Language Models for Software Vulnerability Detection

Chandra Thapa , Seung Ick Jang , Muhammad Ejaz Ahmed , Seyit Camtepe , Josef Pieprzyk , Surya Nepal

分类：人工智能 | 机器学习

2022-04-07

基于变压器的大型语言模型在自然语言处理中表现出色。通过考虑这些模型在一个领域中获得的知识的可传递性，以及自然语言与高级编程语言（例如C/C ++）的亲密关系，这项工作研究了如何利用（大）基于变压器语言模型检测软件漏洞以及这些模型在漏洞检测任务方面的良好程度。在这方面，首先提出了一个系统的（凝聚）框架，详细介绍了源代码翻译，模型准备和推理。然后，使用具有多个漏洞的C/C ++源代码的软件漏洞数据集进行经验分析，该数据集对应于库功能调用，指针使用，数组使用情况和算术表达式。我们的经验结果证明了语言模型在脆弱性检测中的良好性能。此外，这些语言模型具有比当代模型更好的性能指标，例如F1得分，即双向长期记忆和双向封闭式复发单元。由于计算资源，平台，库和依赖项的要求，对语言模型进行实验始终是具有挑战性的。因此，本文还分析了流行的平台，以有效地微调这些模型并在选择平台时提出建议。

translated by 谷歌翻译

DeepCQ+: Robust and Scalable Routing with Multi-Agent Deep Reinforcement Learning for Highly Dynamic Networks

Saeed Kaviani , Bo Ryu , Ejaz Ahmed , Kevin Larson , Anh Le , Alex Yahja , Jae H. Kim

分类：人工智能 | 机器学习

2021-11-29

高度动态的移动ad-hoc网络（MANET）仍然是开发和部署强大，高效和可扩展的路由协议的最具挑战性环境之一。在本文中，我们提出了DeepCQ +路由协议，以一种新颖的方式将新兴的多代理深度增强学习（Madrl）技术集成到现有的基于Q学习的路由协议及其变体中，并在各种拓扑结构中实现了持续更高的性能和移动配置。在保持基于Q学习的路由协议的整体协议结构的同时，DeepCQ +通过精心设计的Madrl代理替换静态配置的参数化阈值和手写规则，使得不需要这些参数的配置。广泛的模拟表明，与其基于Q学习的对应物相比，DeptCQ +产生的端到端吞吐量显着增加了端到端延迟（跳数）的明显劣化。在定性方面，也许更重要的是，Deepcq +在许多情况下维持了非常相似的性能提升，即在网络尺寸，移动条件和交通动态方面没有接受过培训。据我们所知，这是Madrl框架的第一次成功应用MANET路由问题，即使在训练有素的场景范围之外的环境中，即使在训练范围之外的环境中也能够高度的可扩展性和鲁棒性。这意味着我们的基于Marl的DeepCQ +设计解决方案显着提高了基于Q学习的CQ +基线方法的性能，以进行比较，并提高其实用性和解释性，因为现实世界的MANET环境可能会在训练范围的MANET场景之外变化。讨论了进一步提高性能和可扩展性的增益的额外技术。

translated by 谷歌翻译

DAPPER: Performance Estimation of Domain Adaptation in Mobile Sensing

Taesik Gong , Yewon Kim , Adiba Orzikulova , Yunxin Liu , Sung Ju Hwang , Jinwoo Shin , Sung-Ju Lee

分类：机器学习

2021-11-22

许多利用移动设备中的传感器的应用以及应用机器学习以提供新颖的服务。然而，诸如不同的用户，设备，环境和超参数之类的各种因素影响了这种应用的性能，从而使域移位（即，来自训练源数据集的目标用户的分发偏移）是一个重要问题。虽然最近的域适应技术试图解决这个问题，但各种因素之间的复杂相互作用通常会限制其有效性。我们认为，准确估算未训练的域中的性能可能会显着降低性能不确定性。我们呈现Dapper（域适配性能估计器），其估计目标域中的适应性能，只有未标记的目标数据。我们的直觉是目标数据上模型的输出提供了模型在目标域中的实际性能的线索。 Dapper不需要昂贵的标签成本，也不需要在部署后涉及额外的培训。与四个基线相比，我们与四个真实世界传感数据集进行了评估，表明，估计精度平均17％平均占据了基线的表现。此外，我们的On-Device实验表明，与基线相比，Dapper达到了多达216倍的计算开销。

translated by 谷歌翻译